D01:10. 11931/guihaia. gxzw202209047 


基于 叶绿体 基因 组 解析 半 枫 荷 系统 位 置 和 进化 
Wiz, gH 
( 广西 医科 大 学 药学 院 ， 南 宁 530021) 


HE: 为 了 明确 国家 二 级 保护 植物 半 枫 荷 与 近 缘 类 群 的 系统 发 育 关 系 ， 分 析 叶 绿 体 基因 的 适应 性 进化 ， 该 研究 利用 22 个 物种 的 24 条 叶绿体 基因 组 序列 
构建 最 大 似 然 树 和 贝 叶 斯 树 分 析 半 枫 荷 及 其 近 缘 类 群 的 系统 发 育 关 系 ， 并 通过 不 同 模 型 检测 半 枫 蓓 与 近 缘 类 群 的 叶绿体 编码 基因 的 变异 位 点 与 选择 压力 
间 的 关系 。 结 果 表 明 : (1) 半 枫 蓓 叶绿体 基因 组 具有 133 个 基因 ， 包括 蛋白 质 编码 基因 88 个 其 中 TAB WALT, RNA 基因 37 个 ，IRNA 基因 8 
个 。(2) 半 枫 荷 及 其 近 缘 属 曹 树 属 、 枫 香 树 属 8 个 物种 的 叶绿体 基因 组 在 序列 长 度 、 基 因数 量 及 组 成 、GC 含量 等 方面 相对 保守 ， 反问 重复 区 与 小 单 拷贝 
区 边界 高 度 保守 。 小 单 拷贝 区 和 大 单 拷贝 区 的 变异 程度 较 高 ， 而 反 疝 重复 区 的 变异 程度 较 低 。(3) 半 枫 和 荷 与 草 树 属 、 枫 香 树 属 物种 聚 成 草 树 科 分 支 ， 
可 划分 为 三 个 亚 分 支 ， 且 亚 分 支 间或 物种 间 可 能 存在 杂交 或 不 完全 谱系 分 选 。(4) 适应 性 进化 结果 表明 在 不 同 模型 下 ， 曹 树 科 分 支 的 物种 在 ndha 等 叶 绿 
本 基因 受 选 择 约束 (纯化 选择 )， 位 点 模型 也 检测 到 10 个 基因 的 28 个 位 点 p 大 于 0.99， 这 些 编码 基因 变异 可 能 与 草 树 科 植物 适应 性 分 化 有 关 。 该 研究 支 
持 半 枫 荷 隶 属于 曹 树 科 ， 曹 树 科 内 物种 的 叶绿体 基因 可 能 存在 适应 性 进化 ， 这 为 同名 异物 类 药材 的 资源 保护 和 民族 药 的 创新 研发 提供 参考 资料 。 

关键 词 : 半 枫 荷 ， 曹 树 科 ， 叶 绿 体 基因 组 ， 系 统 发 育 ， 适 应 性 进化 
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Abstract: Semiliquidambar cathayensis is treated as a grade-two protected plant in China. However, its phylogenetic relationships with species from 
Hamamelidaceae and Altingiaceae remain unclear. In order to analyze the phylogenetic relationships and adaptive evolution of chloroplast genomes between SS. 
cathayensis and its closely related taxa including species from Hamamelidaceae and Altingiaceae, we reconstructed the Maximum Likelihood tree and the Bayesian 
tree to discover the phylogenetic relationships between S. cathayensis and its closely related taxa from 24 sequences that representing 22 species, and further detected 
the correlation between adaptive sites and selective pressure of protein coding genes under varying models including site model, clade model and branch model. 
Altingiaceae clade was chosen as the foreground clade. The results were as follows: (1) A total of 133 genes were annotated, including 88 protein-coding genes (11 
genes with intron), 37 tRNA genes and eight rRNA genes. (2) Eight chloroplast genomes representing eight species from S. cathayensis and Altingia, Liquidambar 
were relatively conservative in sequence length, gene number and composition, GC content, and there was not obvious diversity in the four boundaries. Relatively 
high variation interspecific were also detected in LSC and SSC regions among these eight chloroplast genomes, while the IR regions were high conservatism. (3) 
Phylogenetic trees showed that S. cathayensis and sampled species of Altingiaceae clustered a group, which further divided into three clades, namely clade I, clade II 
and clade III. The phylogenetic relationships among these clades remain unclear due to hybridization or incomplete lineage sorting (ILS) according to the results of 
test of ILS. (4) The chloroplast genes such as ndhA, ndhG and rps12 were subjected to selection pressure under the clade model and branch model. Furthermore, 28 
sites of ten genes were detected under positive selection with p-value greater than 0.99 based on the site model, which may be related to the adaptive evolution of 
Altingiaceae. In this study, the results of plastid phylogenomics supports that S. cathayensis belongs to Altingiaceae. Several coding genes among these species of 
Altingiaceae may have adaptive evolution. These results will provide data for the further resource protection of homonym drugs and pharmacognostic researches of 
ethnodrug. 
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EAER CBE ar XL. rater KETEM GSemiliquidambar cathayensis) 的 干燥 地 上 部 分 ， 宣 含 生 物 碱 、 黄 酮 类 、 蓝 类 等 而 有 祛 风 除湿 、 活 血 
舒 筋 等 疗效 (Yang et al., 2019; 艇 倾 等 ，2020)， 其 野生 资源 少量 分 布 在 我 国 南部 和 东南 部 山区 ， 为 国家 1 级 保护 植物 ， 目前 用 于 研究 半 枫 荷 群体 遗传 多 
样 性 的 分 子 标记 主要 有 ISSR〔 黄 丽华 等 ，2021)、SSR〔 叶 兴 壮 等 ， 2020，2021a) 和 SRAP〔 叶 兴 壮 等 ， 2021b)， 表明 半 枫 荷 居 群 结构 不 稳定 ， 人 为 干扰 、 
生境 破坏 等 因素 导致 其 濒危 ， 因 此 对 于 半 枫 荷 的 合理 开发 和 管理 都 极为 重要 ， 新 药 源 的 寻找 已 非常 紧迫 〈 傅 立国 ，1991; Ye etal., 2020b)。 半 枫 荷 由 于 形 
态 性 状 上 具有 异形 叶 、 穗 状 花 序 且 上 肉 雄 同 株 等 特点 归 置 于 金 缕 梅 科 (Hamanelidaceae) WER EF} (Subfam. Liqquidambaroideae) 半 枫 荷 属 〈 中 国 科 学 院 
广西 植物 研究 所 , 2005), 该 属 植物 在 形态 与 莹 树 科 的 枫 香 树 属 (Liguidambar) 和 草 树 属 (4ltingia ) 存 在 相似 ,在 某 些 地 区 也 将 曹 树 属 的 曹 树 (Altingia chinensis ) 
作为 药材 半 枫 荷 使 用 。 以 半 枫 共同 名 同 用 途 的 植物 有 5 科 7 属 14 种 〈( 谢 石 杨 等 ，2018)， 因 此 吸 需 对 半 枫 和 荷 类 药材 正本 济源 或 开源 。 分 子 系统 学 研究 结 
果 表 明 半 枫 荷 应 该 归 置 于 曹 树 科 〈Altingiaceae) 半 枫 荷 属 (Semiliquidambar) (Angiosperm Phylogeny Group, 1998; Shi et al., 2001)。 目 前 涉及 半 枫 荷 的 分 
子 系统 学 研究 , 侧重 分 析 金 缕 梅 科 和 曹 树 科 之 间或 曹 树 科 属 间 物 种 的 系统 发 育 关 系 (Shi et al., 1998, 2019; d & Wen, 2006; Wu et al., 2010; Xiang et 
al., 2019; Tang et al., 2020; Ye et al., 2020a; Zhang et al., 2020a)， 半 枫 荷 及 其 近 缘 类 和 群 种 间 的 系统 发 育 关 系 尚 需 进 一 步 分 析 ， 而 探讨 半 枫 和 荷 与 曹 树 科 或 爹 缕 
梅 科 植 物 的 系统 发 育 关 系 7 利于 对 半 枫 荷 及 其 混 伪 品 进行 分 子 鉴定 ， 从 而 达到 正本 清 源 的 目的 。 此 外 ， 曹 树 科 三 个 属 植物 的 主要 分 布 在 我 国 西南 地 区 ， 
半 枫 荷 及 其 近 缘 类 群 在 基因 的 结构 上 或 进化 速率 上 是 否 有 分 化 ， 进 而 对 药理 疗效 存在 影响 仍 需 进一步 分 析 。 
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通过 叶绿体 基因 组 序列 的 比较 分 析 和 系统 发 育 树 的 构建 等 方式 可 评估 物种 系统 发 育 位置 和 演化 关系 (Sloan et al., 2014; Williams et al., 2019)。 在 此 基 
础 上 ， 利 用 叶绿体 编码 基因 的 进化 速率 差异 评估 不 同 植物 类 群 的 基因 变异 与 选择 压力 间 的 关系 ， 可 作为 探索 新 药 源 的 基础 CWaldvogel et al., 2020; Zhao et 
al., 2020)。 目 前 ， 半 枫 荷 及 近 缘 类 群 的 草 树 科 、 金 缕 梅 科 多 个 物种 的 叶绿体 基因 组 已 有 报道 ， 鉴 于 此 ， 本 研究 利用 公共 数据 库 中 已 公开 发 表 的 半 枫 荷 及 
其 近 缘 类 群 的 叶绿体 基因 组 ， 拟 探讨 以 下 问题 : CIO 通过 构建 系统 发 育 树 来 揭示 半 枫 荷 在 草 树 科 或 金 缕 梅 科 的 系统 发 育 位 置 ; (2) 分 析 半 枫 荷 及 其 近 缘 
类 群 的 叶绿体 基因 的 进化 位 点 与 选择 压力 的 关系 ， 为 半 枫 蓓 的 鉴定 、 资 源 开发 提供 一 定 的 借鉴 意义 
1 材料 与 方法 
T 1.1 数据 收集 
P 通过 NCBI 数据 库 (The National Center for Biotechnology Information) 1ER FINE, BEAN AL Al Se RR EA ARRE REAA E. KER 
- 到 莹 树 科 半 枫 荷 属 的 半 枫 荷 的 2 个 个 体 序列 ， 曹 树 属 3 个 物种 ， 枫 香 树 属 4 Due 其 中 枫 香 树 2 个 个 体 序列 ， 另 外 ， 选 择 金 缕 梅 、 水 丝 梨 等 10 个 金 缕 
- 梅 科 的 物种 、 虎 皮 楠 科 1 个 物种 、 连 香 树 科 1 TOR. FERAL 2 个 物种 ， 总 共 22 个 物种 的 24 个 叶绿体 基因 组 序列 。 下 载 检索 到 的 物种 的 叶绿体 基因 组 
c 序列 、 名 称 、 基 因 组 序列 号 详 见 表 1. 
eo 1.2 叶绿体 基因 组 比较 分 析 
em 采用 Geneious R9 (Kearse et al., 2012) 分 析 并 统计 草 树 科 8 个 物种 叶绿体 基因 组 序列 的 4 个 边界 CB A PPS UX LSC, EU SSC 和 反 向 重复 
[X IR) 长 度 和 基因 数 目 类 型 等 信息 GEI. SH R 软件 的 IRscope 程序 (Amiryousefi et al., 2018) 对 曹 树 科 8 个 物种 的 4 个 边界 的 收缩 与 扩张 进行 可 视 
化 分 析 。 利 用 mVISTA 软件 (Frazer et al., 2004) 基于 基因 重 排 和 倒 位 的 全 局 比 对 模式 (Shuffle-LAGAN) 对 半 枫 荷 及 近 缘 物种 8 个 叶绿体 基因 组 序列 进 
行 同 源 性 比较 研究 ， 并 利用 Geneious R9 软件 中 的 Mauve 多 重 基 因 组 比 对 法 对 这 8 个 物种 的 叶绿体 基因 组 序列 进行 共 线 性 比较 。 
13 系统 发 育 分 析 
d 本 研究 利用 在 线 MAFFT v7 (Katoh et al., 2002) os //mafft.cbrc.jp/alignment/software/) 比 对 了 从 NCBI 上 检索 到 的 22 个 物种 的 24 条 叶绿体 基因 组 
,一 序列 〈 表 1)。 利 用 DMABE v6.4.29 对 比 对 序列 是 否 否 适 合用 于 系统 发 育 研究 进行 序列 替代 饱和 度 分析 ， 评 估 观 测 A 值 (index of substitution saturation) 是 
» 否 显著 低 于 有 se 值 〈critical index of substitution saturation) (Xia et al., 2003; Xia & Lemey, 2009). P sc 又 可 分 为 有 cswm〈 对 称 性 蔡 代 饱和 指数 ) 和 Tes asym 
sY ( 非 对 称 性 蔡 代 饱和 指数 )。 利 用 在 线 网 站 CIPRES Web Portal 2.0 Chttp://www.phylo.org) 的 RA x ML 进行 最 大 似 然 树 (maximum likelihood, ML) 的 构 
io 建 。 最 大 似 然 分 析 采 用 GAMMA 模型 ， 快 速 自 展 法 1000 次 。 利 用 jModelTest (Posada & Crandall, 1998; Darriba et al., 2012) AIC 值 为 每 个 数据 集 选 
"= 取 最 优 建树 模型 。 利 用 MrBayes v3.2.6 CRonquist & Huelsenbeck, 2003) 构建 贝 叶 斯 树 (Bayesian, BI), ies 3 百 万 代 ， 每 每 1,000 代 取 样 一 次 ， 去 掉 未 达 
Q 到 稳 态 的 前 25% 的 树 ， 其 余 的 树 用 来 计算 后 验 概率 。 
本 研究 利用 淹 祖 模拟 去 检测 不 完全 谱系 分 选 对 于 核 基因 树 和 叶绿体 树 的 冲突 存在 多 大 影响 。 首先, 在 溯 祖 模型 下 利用 软件 DendroPy v4.1.0 (Sukumaran 
& Holder, 2010) 对 24 个 叶绿体 基因 组 序列 模拟 得 到 10000 棵 叶绿体 物种 树 ， 利 用 ASTRAL 构建 物种 树 作 为 参考 ， 对 这 10000 棵 模拟 树 进 行 汇 总 ， 得 到 
各 个 分 支 频率 〈clade frequency)。 在 不 完全 谱系 分 选 的 情况 下 ， 任 何在 经 验 叶绿体 树 Cempirical plastid tree) 中 所 得 系统 发 育 关系 都 应 该 在 模拟 的 叶绿体 
树 (simulated plastid tree 〉 中 体现 ， 因 此 各 分 支 应 该 具有 较 高 支持 率 ; 如 果 在 杂交 情况 下 ， 经 验 叶绿体 树 的 部 分 分 支 在 模拟 基因 树 中 支持 率 较 低 甚至 不 存 
1E (Garia et al., 2017; Morales-Briones et al., 2018). 


表 1 本 研究 所 用 叶绿体 基因 组 Genbank 登录 号 及 基本 特征 


Table 1 Genbank accession numbers and characteristics of chloroplast genomes of species in the present study 


ra 叶绿体 基因 组 ARAS WK 小 单 拷贝 区 有 反问 重复 区 
物种 " GenBank ~ Chloroplast Large single Samll single Inverted repeat ”参考 文献 
Taxon. Famil GenBan genomes copy (LSC) copy (SSC) CIR) Reference 
y accession number 长 度 长 度 长 度 EH 
0 0 0 0 
Length ote Length oc Length ote Length ote 
半 枫 荷 金 缕 梅 科 Tang et al., 
Semittauianhar eathapenivChine Hamamelidaceae MN837678 160 444 37.9 88969 36.1 18 913 32.4 26281 43.1 2020 
半 枫 荷 金 缕 梅 科 Zhang et al., 
Steathapensi Chane Hamamelidaceae MN782512 160 430 37.9 88 991 36.1 18 917 32.4 26261 43.1 2020a 
枫 香 树 金 缕 梅 科 Dong et al., 
Dvd on on ane Hamamelidaceae KC588388 160 410 37.9 88 945 36.1 19 037 32.4 26214 43.1 2013 
TE e 全 缕 梅 科 
枫 香 树 Se EM . MT079213 164 426 37.9 88 958 36.1 18 920 32.4 26274 43.1 — 
L. formosana Hance Hamamelidaceae 
GREE MUS Mr EMER Lai et al. 
MT 212 : : j : d 
1 dodlydtna Chane Hamamelidaceae 079 160 433 37.9 88 903 36.1 18 922 32.4 26274 43.1 2020 
pe E ZE ER 
di H : . Se EM : MT079214 160 771 37.9 88882 36.1 18 947 32.4 26471 43.1 = 
L. orientalis Mill. Hamamelidaceae 
MUS 类 梅 科 
北美 机 Se EM ; MT079215 160 750 37.9 88 891 36.1 18 977 32.4 26441 43.0 = 
L. styraciflua L. Hamamelidaceae 
bul 金 缕 梅 科 Ye et al 
Altingia chinensis (Champ.) Oliver ex MT193687 160 401 37.9 89 988 36.2 18 917 32.4 25222 43.1 2 
Hance Hamamelidaceae 2020a 
细 青 皮 金 缕 梅 科 Yang et al., 
De re Hariamelidaceas MN106247 160 861 37.9 89126 36.0 19011 32.2 26362 43.0 2020 
云南 曹 树 金 缕 梅 科 MN106248 160860 379 89126 360 19008 322 26325 431 Quetal. 


2020 


A. yunnanensis Rehd. et Wils. 
金 缕 梅 

Hamamelis mollis Oliver 

水 丝 梨 

Sycopsis sinensis Oliver 

AE AE 
Fortunearia sinensis Rehd. et Wils. 
山 白 树 

Sinowilsonia henryi Hemsl. 

WC 

Corylopsis spicata Hemsl. 
朝鲜 蜡 办 花 

C. coreana Uyeki 

四 药 门 花 

Loropetalum subcordatum (Bentham) 
Oliver 

双 花 木 

Disanthus cercidifolius Maxim. 
AGER 

Mytilaria laosensis Lec. 

红 花 荷 

Rhodoleia championii Hook. f. 

虎 皮 楠 

Daphniphyllum oldhamii (Hemsl.) 
Rosenthal 

连 香 树 

Cercidiphyllum japonicum Sieb. et 
Zucc. 
牡丹 
Paeonia suffruticosa Andrews 
ASAI 


Hamamelidaceae 
4 ZENE BL 
Hamamelidaceae 
金 缕 梅 科 
Hamamelidaceae 
金 缕 梅 科 
Hamamelidaceae 
金 缕 梅 科 
Hamamelidaceae 
4 ZENE BL 
Hamamelidaceae 
金 缕 梅 科 
Hamamelidaceae 
金 缕 梅 科 
Hamamelidaceae 
金 缕 梅 科 
Hamamelidaceae 
金 缕 梅 科 
Hamamelidaceae 
金 缕 梅 科 
Hamamelidaceae 
虎 皮 楠 科 
Daphniphyllaceae 


连 香 树 科 
Cercidiphyllaceae 
芍药 科 
Paeoniaceae 
芍药 科 
Paeoniaceae 


MH191387 


MT323104 


MK533616 


MF687003 


MK942341 


MG835449 


MG457805 


MK411769 


MN106252 


MK834325 


MH191390 


MK564061 


MH191384 


MK860971 


159 731 


159 093 


159 441 


158 741 


159 507 


159 398 


158 706 


158 149 


159 941 


159 115 


160 137 


159 871 


153 119 


152 731 


88 301 


87 841 


88 124 


87 507 


88 243 


88 168 


88 216 


87 140 


89 016 


88 123 


88 075 


88 023 


84 564 


84 402 


36.1 


36.2 


36.3 


36.4 


36.1 


36.1 


36.1 


36.0 


35.9 


35.8 


36.1 


36.0 


36.6 


36.7 


18 882 


18 911 


18 781 


18 768 


18 836 


18 812 


18 586 


18 291 


18 127 


18 131 


19 085 


19 106 


17 059 


16 969 


26 274 


26 171 


26 268 


26 233 


26 214 


26 209 


25 952 


26 359 


26 399 


26 420 


26 486 


26 371 


25 751 


25 680 


Dong et al., 
2018 
Peng et al., 
2020 
Xu et al., 
2019 
Ren et al., 
2018 
Kim et al., 
2019 
Choi et al., 
2018 
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1.4 适应 性 进化 分 析 

利用 Geneious R9 将 24 条 叶绿体 基因 组 的 各 个 基因 提取 后 比 对 ， 并 去 掉 终 止 密码 子 ， 
用 EasyCodeML (Gao et al., 2019) 将 基因 比 将 序列 批量 转换 成 .pml 格式 。 将 基于 24 条 叶 
绿 体 基因 组 构建 的 最 大 似 然 树 作 为 树 文 件 (.nwk 格式 )， 利 用 软件 EasyCodeML 分 别 选择 进 
化 枝 模 型 (elade model), IRA! (branch model) 和 位 点 模型 (stie model) 进行 适应 性 进化 
分 析 。 进 化 枝 模型 可 以 检测 整个 进化 枝 或 重点 关注 支 系 上 特异 位 点 的 选择 约束 性 ; 枝 模型 可 
以 检测 所 关注 支 系 的 选择 约束 强度 ; 位 点 模型 可 以 在 不 考虑 支 系 的 情况 下 检测 受到 正 选择 位 
点 的 情况 。 在 进化 枝 模 型 和 枝 模 型 中 ， 将 曹 树 科 分 支 标记 为 前 景 校 。 
2 结果 与 分 析 
2.1 半 枫 荷 叶 绿 体 基因 组 结构 的 基本 特征 

半 枫 荷 的 叶绿体 基因 组 为 160 430 ~160 444 bp, LSC 为 88 969 ~88 991 bp, SSC 为 18 913 
~18 917 bp, IR 为 26 261 ~26 281 bp, GC 含量 均 为 37.9%， 无 差异 。 半 枫 荷 与 荤 树 科 7 个 物 
种 的 叶绿体 基因 组 相 比 ， 基 因 总 数 为 133 个 ，rRNA 79 8/8. CH 4 AE IR K), tRNA 为 
37 个 (其 中 7 个 在 IR 区 )， 和 蛋白 质 编码 基因 数 为 88 个 (其 中 7 个 在 IR 区 )， 其 中 共 检 测 到 
11 个 含 内 含 子 的 蛋白 编码 基因 : rps16、atpF、 rpoCl、 ycf3. clpP. petB、 petD、 rpl16、rpl2、 
ndhB、ndhA， 其 中 rpl2. ndhB 分 布 在 IR KX, yc 和 clpP 有 两 个 内 含 子 ， 而 内 含 子 长 度 的 
变化 导致 了 基因 长 度 有 变化 ( 表 1)。8 个 物种 中 matK、ndhK 基因 的 蛋白 质 编码 区 序列 长 度 
有 变化 。 与 之 相 比 ， 金 缕 梅 科 7 个 物种 的 基因 总 数 为 133 个 , rRNA 为 8 个 〈 其 中 4 个 在 IR 
DO, tRNA 为 37 个 (其 中 7 个 在 IR 区 )， 和 蛋白 质 编 码 基 因数 为 88 个 (其 中 7 个 在 IR 区 )。 
2.2 半 枫 荷 及 近 缘 属 叶绿体 基因 组 IR 与 SC 边界 

半 枫 荷 与 近 缘 类 群 共 8 个 物种 的 叶绿体 基因 组 在 序列 长 度 、 基 因 排 序 及 数量 、GC 含量 
AED RAE, IR 区 和 SC 区 边界 的 过 渡 区 域 上 基因 排 布 无 差异 ， 只 在 基因 序列 长 短 有 差异 ， 
具有 高 度 保守 性 (图 1 )。IRb 与 LSC 边界 除了 半 枫 荷 在 rps19 与 rpl2 的 间隔 区 ， 其 余 7 个 
物种 都 在 基因 rps19。IR 区 和 SSC 区 边界 均 在 ycfl Eo 
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Fig.l Comparison of borders of IR and SC regions in eight species of Semiliquidambar 
cathayensis and its related taxa 


2.3. 半 枫 荷 及 近 缘 属 叶绿体 基因 组 序列 变异 分 析 

本 研究 采用 mVISTA 软件 ， 对 半 枫 蓓 及 其 他 曹 树 科 7 个 物种 的 叶绿体 基因 组 序列 同 源 
性 进行 分 析 ， 在 全 局 对 比 模式 下 检测 基因 重 排 和 倒 位 (图 2)。 结 果 表 明 曹 树 科 8 个 物种 叶 
绿 体 基 因 组 4 个 部 分 排列 顺序 保守 性 高 , 在 非 基因 编码 区 有 明显 变异 ， 而 基因 编码 区 变异 不 
明显 。SSC H LSC 均 有 明显 变异 ， 尤其 在 LSC 区 域 的 基因 间隔 区 变异 较 高 ，IR 区 变异 程度 
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图 2 以 半 枫 荷 〈 参 考 序列 ) 及 其 近 缘 类 群 8 个 物种 叶绿体 基因 组 比 对 


Fig.2 Alignment of eight species of Semiliquidambar cathayensis (reference sequence) and its 
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related taxa 


2.4 半 枫 荷 及 近 缘 属 叶绿体 基因 组 共 线 性 分 析 

本 研究 利用 Geneious R9 的 Mauve 比 对 法 检测 半 枫 荷 及 曹 树 科 7 个 物种 的 叶绿体 基因 组 
的 重 排 和 共 线 性 (图 3)， 通 过 多 重 基因 组 比 对 法 检测 出 8 个 种 的 叶绿体 基因 组 之 间 有 1 个 
局 部 共 线 块 (locally collinear block)， 这 表明 曹 树 科 8 个 种 之 间 的 基因 组 具有 高 度 相似 性 
同时 并 没有 检测 到 重 排 或 倒置 。 
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每 个 不 同 颜 色 的 区 块 代表 不 同 基因 ， 黑 色 代 表 的 是 转运 RNA， 红 色 代 表 的 核糖 体 RNA， 白 
色 的 是 蛋白 质 编码 基因 ， 绿 色 代 表 具 有 内 含 子 的 转运 RNA. 

The small blocks of various colors represent genes. Black represents transfer RNA (tRNA); red 
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图 3 半 枫 荷 及 其 近 缘 类 群 8 个 物种 叶绿体 基因 组 比 对 


Fig.3 Alignment of eight species of Semiliquidambar cathayensis and its related taxa 


2.5 系统 发 育 分 育 

本 研究 使 用 DAMBE 对 上 述 叶 绿 体 基因 组 序列 矩阵 进行 碱 基 蔡 换 饱 和 度 检测 ， 结 果 表 
明 在 随机 抽取 4、8、16、32 个 类 群 时 ， 对 称 拓扑 结构 和 非 对 称 拓 扑 结构 中 的 序列 替换 饱和 
指数 ss) 都 显著 小 于 标准 蔡 换 饱和 指数 (1ss.)， 因 此 可 以 用 于 后 续 的 系统 发 育 树 的 构建 
箭 选 出 的 最 佳 模型 是 GTR+ItHG， 基 于 24 个 叶绿体 基因 组 序列 构建 的 最 大 似 然 树 (ML) 和 
贝 叶 斯 树 BD 拓扑 结构 基本 一 致 〈 图 4)。 曹 树 科 的 物种 聚 为 一 类 ， 金 缕 梅 科 物 种 聚 为 一 
类 。 其 中 萤 树 科 的 物种 中 半 枫 蓓 CS. cathayensis ) 5j & CA. chinensis). WEW CL. formosana), 
ih ERM CL. acalycina) 构成 Clade I (99/1.00)， 细 青皮 CA. excelsa) FIZ MBM CA. 
yunnanensis) 构成 Clade I (100/1.00)， 苏 合 香 CL. orientalis) 和 北美 机 香 CL. styraciflua) 
构成 Clade II 〈100/1.00)， 虎 皮 楠 CDaphniphyllum oldhamii) 和 连 香 树 (Cercidiphyllum 
japonicum) 各 自 单独 成 一 文 ， 并 依次 构成 草 树 科 物 种 的 姐妹 类 群 ， 所 取样 的 金 缕 梅 科 的 物 
种 可 划分 为 Fothergilleae 7) ~ Hamamelideae 47 x: ~ Eustigmtaeae 分 支 和 Corylopsideae 分 支 。 
基于 淹 祖 模拟 检测 不 完全 谱系 分 选 对 于 叶绿体 树 的 拓扑 结构 的 影响 , 结果 表明 多 个 分 支 的 分 
文 频 率 较 低 〈 图 4)， 表 明 曹 树 科 内 多 个 分 支 的 系统 位 置 不 排除 受到 叶绿体 不 完全 谱系 分 选 
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比例 尺 代表 将 换 率 为 0.02。 分 支 上 数值 为 最 大 似 然 法 自 展 文 持 率 、 
斯 法 的 后 验 概率 和 模拟 基因 树 的 分 支 频 率 
于 Phylogenetic tree was drawn based on BI tree. The scale bar shows 0.02 substitutions/site. 
PP Numbers above branches are ML bootstrap values, BI posterior probability and clade frequencies 
of the simulated gene trees 

4 基于 24 个 叶绿体 基因 组 构建 的 系统 发 育 树 
Fig.4 Phylogenetic tree based on 24 chloroplast genomes 


以 贝 叶 斯 树 为 骨架 ， 


贝 叶 


2.6 适应 性 分 化 

利用 枝 模 型 以 荤 树 科 分 支 为 前 景 枝 ， 检 测 到 3 个 基因 受到 选择 约束 CO<@<1), ndhA 
(@=0.051, P<0.05), ndhG (w=0.024，P<0.01)，rps12 (w=0.0001，P<0.01)。 利 用 进化 枝 
模型 以 曹 树 科 分 支 为 前 景 枝 ， 检 测 到 12 个 基因 (atpE、atpF、ndhA、ndhJ、psbM、rbcL、 
rplld. rpoC2. rps2. rps3. rps4. rpsl2. rpsl4) 有 明显 的 选择 约束 性 〈 表 2). US 点 模 
型 检测 叶绿体 基因 组 上 各 基因 的 正 选择 位 点 ， 发 现 accD. atpE. atpF. clpP. ndhA 等 共 10 
个 基因 受到 选择 压力 , 其 中 有 45 个 位 点 受到 正 选择 己 值 大 于 0.95, 28 个 位 点 己 值 大 于 0.99 
X3). 


tf 


表 2 叶绿体 基因 组 75 个 基因 基于 进化 枝 模型 的 选择 压力 分 析 


= Table 2 Selection analysis of 75 genes in chloroplast genome based on the clade model 


= 基因 对 数 似 然 值 ” 似 然 比 检验 P 值 | 基因 对 数 似 然 值 似 然 比 检 验尸 值 
Gene LnL LRT P-value Gene LnL LRT P-value 
atpE -898.074 195 rpoC2 -9 958.877 522 0.034 220 524 
-901.350 088 0.010 477 893 -9 961.119 348 

atgP -] 291.364 566 rps2 -] 427.898 042 0.023 202 398 
-] 288.559 188 0.017 850 560 -] 430.474 686 

ndhA -2 514.008 221 rps3 -1 624.303 334 0.044 710 820 
-2 522.610 159 0.000 033 575 -1 626.318 091 

ndh] -940.492 126 rps4 -1 345.749 023 0.038 016 496 
-944.404 780 0.005 151 967 -1 347.901 165 

psbM -194.029 138 rpsl2 -1 434.578 086 0.004 549 296 
-196.727 559 0.020 173 222 -] 438.603 299 

rpll4 -758.863 479 rpsl4 -643.595 456 0.041 753 463 
-763.337 761 0.002 776 878 -645.668 041 


表 3 叶绿体 基因 组 75 个 基因 基于 位 点 模型 的 选择 压力 分 析 


Table 3 Selection analysis of 75 genes in chloroplast genome based on the site mode 


基因 似 然 比 检验 P 值 正 选择 位 点 

Gene LRT P-value Positive selcetion sites 

accD 5.93x10? 86 Q 0.998** 

atpE «10:16 104 Q 0.999**,134 K 1.000** 

atpF 1.88x10+ 108 W 0.999** 

clpP 2.4x107 12 N 0.999** 37 E 1.000**,87 R 0.999**,110 K 0.986*,130 S 0.976*,153 7 0.957* 

ndhA 6.81x10° 31 L 0.986*,116 G 0.986*,118 H 0.995**,213 7 0.953*,294 A 0.989* 

ndhB 1.69x102? 367 R 0.977* 

rbcL «1076 95 S 0.994** 142 P 0.985*,145 S 1.000**,251 7 0.995**,279 S 0.970*,309 M 1.000**,328 A 1.000** 

rpl22 2.85104 3P0.999** 12 0 0.981* 
3 F 0.995**.295 E 0.976*,362 W 0.995**,370 S 0.994**,389 S 0.991***,396 S 0.999** 411 D 0.968*,431 K 1.000**,437 H 

0.957*.440 F 0.969*,499 T 0.999** 533 G 0.975*,560 S 1.000**,572 A 0.971*,580 P 0.999**,630 7 0.978*,632 V 0.985*,765 K 

ycfl «10:16 0.971*,777 G 0.963*,783 L 0.997** 789 G 0.991**,795 K 0.975*,796 F 0.974*,826 Q 0.975*,852 I 0.989*,910 H 0.989*,929 A 

0.989*,957 D 0.966*,979 T 0.982*,1007 H 0.970*,1068 R 0.986*,1141 K 0.999**,1163 70.983*,1176 D 0.996**, 1230 K 
0.962*,1238 Y 0.963*,1249 S 0.986*,1260 V 1.000**,1274 W 0.955*,1283 C 0.985*,1377 G 0.953*,1425 N 0.979* 
ycf2 7.98x10° 429 A 0.962*,778 W 0.972*,1131 L 0.973*,1516 A 0.959*,1527 A 0.959*,1705 10.955* 


TE: 正 选 择 位 点 


A P > 95%; ** P> 99% 


Note: Positively selected sites (* P > 95%; ** P > 99%). 
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3 讨论 与 结论 
3.1 半 枫 荷 属 与 曹 树 属 、 枫 香 树 属 的 系统 发 育 关 系 
本 研究 基于 叶绿体 基因 组 对 半 枫 荷 属 与 曹 树 属 、 枫 香 树 属 的 亲缘 关系 进行 分 析 ,， 结果 表 
明 半 枫 荷 属 、 萤 树 属 和 枫 香 树 属 三 个 属 的 物种 均 不 能 各 自 构 成 单 系 类 群 , 支持 将 半 枫 荷 属 归 
置 于 曹 树 科 ， 这 与 基于 叶绿体 基因 数据 的 分 子 系统 学 、 花 粉 粒 形 态 等 研究 结果 一 致 
CIckert-Bond & Wen, 2013), 但 《中 国 植物 志 》 te Wr. FE EE SE IB AS HERS AE a tir J 
草 树 属 和 枫 香 树 属 归 置 于 金 缕 梅 科 的 枫 香 树 亚 科 。 这 些 属 的 形态 鉴别 要 点 ， 如 叶片 的 长 度 和 
FEAR. MAAR AACR BE. RP EAS SE TR FE RE FUR MEETS AER 中 存在 连续 变 
异 ， 从 而 缺少 系统 性 量化 标准 , 加 之 半 枫 和 荷 属 植物 具有 同 科 枫 香 树 属 和 曹 树 属 植物 的 过 渡 形 
态 性 状 ， 因 此 很 难 根据 形态 性 状 将 半 枫 人 荷 属 植物 与 草 树 属 、 枫 香 树 属 植物 进行 区 分 。 
前 人 分 子 系统 学 表明 半 枫 荷 属 、 曹 树 属 和 枫 香 树 属 物种 为 东亚 分 支 (E. Asia Clade)， 但 
分 支 内 各 物种 杀 缘 关系 模糊 不 清 , 可 能 需要 进一步 开发 高 分 辨 率 的 分 子 标记 来 分 析 各 物种 系 
统 发 育 关 系 (Ickert-Bond & Wen, 2013 )。 本 研究 基于 叶绿体 基因 组 比较 分 析 ， 发 现 草 树 科 8 
个 物种 的 叶绿体 基因 组 在 基因 结构 、 排 列 和 数目 , R 和 SC 连接 区 均 具 有 较 高 的 保守 性 ， 各 
物种 基因 组 的 长 度 变 化 主要 体现 在 内 含 子 或 者 编码 区 序列 的 长 度 变 化 ， 后 续 可 从 叶绿体 基因 
组 的 编码 区 间隔 区 等 相对 高 变异 区 域 开发 高 分 辩 率 的 分 子 标记 用 于 半 枫 荷 的 分 子 鉴定 、 遗 传 
分 化 等 研究 。 
32 半 枫 荷 及 其 近 缘 类 群 的 系统 发 育 关系 
本 研究 基于 叶绿体 基因 组 对 半 枫 荷 及 其 近 缘 类 群 的 系统 发 育 关系 进 行 分 析 , 结果 表明 所 
取样 半 枫 荷 个 体 没 有 构成 单 系 类 群 , 半 枫 和 荷 与 曹 树 、 枫 香 树 、 缺 萝 枫 香 树 构成 Clade 划 99/1.00)， 
利用 淹 祖 原理 的 叶绿体 基因 树 的 检测 经 结果 表明 ， EOR HE} 
内 各 分 支 可 能 存在 杂交 或 叶绿体 不 完全 谱系 分 选 , AE EAR ZR AS EN AI RE o x 5S TT 
人 的 分 子 系 统 学 结果 一 致 ， 半 枫 荷 与 枫 香 树 、 ne 但 支持 率 不 高 ， 推 
测 半 枫 荷 可 能 是 个 杂交 种 (Shi et al., 2001; Ickert-Bond & Wen, 2013 )。 由 于 现 有 研究 选用 了 
少量 基因 片段 和 不 同 的 样本 , 半 枫 蓓 与 枫 香 树 属 和 萤 树 属 物种 的 杂交 程度 仍然 模糊 ， 因 此 需 
要 在 居 群 水 平 上 研究 半 枫 荷 的 遗传 背景 。 
ed 3.3 草 树 科 植 物 的 适应 性 分 化 
由 于 环境 变化 可 以 促使 植物 基因 的 适应 性 进化 〈Kelly, 2019)， 因 此 本 研究 采取 不 同 的 
> 模型 检测 到 萤 树 科 及 其 近 缘 类 群 有 多 个 基因 都 可 能 受到 选择 压力 , 以 期 探讨 基因 位 点 的 选择 
压力 与 近 缘 物种 、 环 境 是 否 存在 一 定 相 关 性 。 
基于 本 研究 的 进化 枝 模型 结果 发 现 以 曹 树 科 分 支 作为 前 景 枝 时 ， 多 个 a 基因 、ndh 基 
因 和 rps 基因 有 明显 的 选择 约束 性 ， 这 些 基因 在 其 他 植物 类 群 中 大 多 与 光合 作用 、 转 录 翻 译 
等 功能 相关 。 例如 ndh 类 基因 家 族 在 光合 作用 中 有 着 至 关 重 要 的 作用 ,同时 任何 环境 改动 或 
是 植物 受到 胁迫 等 压力 ， 该 类 基因 也 会 敏感 的 发 生变 异 (Martin & Sabater, 2010; Zhao etal., 
20200; 核糖 体 蛋白 大 小 亚 基 基因 rpl 和 rps 是 与 植物 转录 翻译 过 程 中 的 重要 基因 ，7ps12、 
atpF 等 基因 的 转录 本 也 参与 叶绿体 工 型 内 含 子 的 剪 切 过 程 〈《Vogel et al., 1999)， 其 中 ATP 
合 酶 基因 在 光合 作用 中 必 不 可 少 ; 而 rpoC2 基因 编码 叶绿体 RNA 聚合 酶 的 p" 亚 基 ， 在 转录 
工程 中 发 挥 重要 作用 。 莹 树 科 物种 大 多 分 布 在 我 国 西南 地 区 ， 由 此 推测 其 光合 作用 功能 可 和 
为 了 适应 相对 高 温 高 湿 的 环境 , 而 与 金 缕 梅 科 植 物 存在 差异 。 这 与 前 人 基于 半 枫 荷 的 转录 组 
数据 结果 类 似 ， 半 枫 荷 转录 组 中 有 92 个 Unigene 映射 在 光合 作用 调控 通路 ，32 个 Unigene 
映射 到 光合 作用 一 天 线 蛋 白 通 路 CHIR 2018). 此 本 研究 或 可 为 在 基因 水 平 上 研究 
半 枫 荷 的 光照 响应 提供 基础 。 
本 研究 基于 位 点 模型 分 析 不 同 基因 的 氨基 酸 位 点 是 否 经 历 选择 压力 ， 结 果 表 明 accD、 
clpP. rbcL, ycfl 和 ycf2 等 10 个 基因 的 45 个 位 点 受到 正 选择 己 值 大 于 0.95, 28 个 位 点 P 
BAF 0.99， 而 基因 检测 到 正 选择 压力 的 位 点 数目 最 多 ， 说 明 变 异 程度 大 ， 这 些 基因 在 光合 
作用 、 植 物 的 新 陈 代谢 等 多 个 环节 都 发 挥 作 用 ， 例 如 前 人 研究 结果 表明 accD 基因 编码 乙酰 
辅酶 A 羧 化 酶 的 Bp 亚 基 ， 在 脂肪 酸 的 生物 合成 中 发 挥 作用 ， 因 此 ， 在 被 子 植物 叶绿体 中 该 基 
因 常 会 转移 或 缺失 是 植物 适应 环境 的 结果 之 一 (Slabas & Fawcett, 1992), 推测 该 基因 的 变化 
可 能 帮助 曹 树 科 植物 适应 生境 ;cpP 基因 是 叶绿体 基因 组 内 编码 clpP 蛋白 酶 的 基因 家 族 成 
员 ， 能 降解 多 肽 ， 既 能 帮助 控制 植物 的 代谢 过 程 正常 进行 ， 又 能 在 植物 的 生物 抗 逆 肋 迫 中 发 


挥 重 要 作用 《〈 郑 春花 等 ，2016)， 由 此 本 研究 推测 其 在 曹 树 科 物 种 适应 西南 地 区 相对 湿热 的 
环境 中 可 能 起 关键 作用 。 而 rbcL 在 植物 光合 作用 中 作为 光合 电子 传递 的 调节 器 ， 编 码 叶 绿 
体 中 Rubisco 的 大 亚 基 ， 该 大 亚 基 的 C 末端 区 域 在 光合 系统 中 存在 重要 意义 〈Curmi etal., 
1992); ycf1 和 ycf2 基因 进化 速率 较 快 , 具有 编码 叶绿体 ATP 酶 和 调控 植物 果实 发 育 的 功能 ， 
与 其 他 植物 情况 类 似 ， 说 明 ycf 类 基因 在 植物 中 普遍 存在 适应 性 进化 的 现象 (Zhou et al., 
2019)。 总 之 ， 这 些 基因 可 能 在 曹 树 科 植 物 、 半 枫 荷 类 原 植 物 适 应 南方 的 环境 气候 的 过 程 中 
发 挥 了 重要 作用 。 

目前 ， 半 枫 荷 属 植物 主要 集中 在 我 国 西南 地 区 ,， 现 有 研究 的 取样 范围 和 分 子 标记 选择 受 
民 ， 使 得 半 枫 荷 属 的 属 间 关系 仍 存在 模糊 。 本 研究 目前 只 是 基于 公开 数据 库 中 的 叶绿体 基因 
组 序列 分 析 了 半 枫 荷 及 其 近 缘 类 群 的 叶绿体 基因 组 结构 差异 、 系 统 发 育 关 系 和 基因 位 点 选择 
压力 ,未 能 很 好 推测 半 枫 荷 与 枫 香 树 、 缺 苯 枫 香 树 、 曹 树 等 物种 的 关系 ， 因 此 未 来 应 该 扩大 
半 枫 和 荷 及 其 近 缘 类 群 的 采样 范围 ,选择 分 辩 率 较 高 的 分 子 标记 ， 探 讨 半 枫 荷 与 草 树 属 、 枫 香 
树 属 物种 的 杂交 或 不 完全 谱系 分 选 等 问题 。 
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